Soft Forks: How Agent Skills Create Specialized AI Without Training
我们之前的文章将模型上下文协议 (MCP) 定义为提供 AI 代理工具的工具箱,将代理技能作为指导 AI 代理如何完成任务的材料。这与训练前或训练后不同,后者决定模型的一般行为和专业知识。特工技能不会“训练”特工。他们软分叉代理行为 [...]
这是有关代理工程和人工智能驱动开发系列的第一篇文章。请期待 3 月 19 日 O’Reilly Radar 上的下一篇文章。关于人工智能和软件开发有很多炒作,它有两种类型。有人说,“我们都注定了,像 Claude Code 这样的工具将制造软件 [...]
The “Data Center Rebellion” Is Here
这篇文章首次出现在 Ben Lorica 的 Gradient FlowSubstack 时事通讯上,经作者许可在此重新发布。即使是人工智能最热心的支持者现在也悄悄承认,我们正在经历一个巨大的人工智能泡沫。这些数字是显而易见的:超大规模企业每年在数据中心和专用芯片上部署大约 4000 亿美元,而 [...]
在上一篇文章中,我们概述了为什么 GPU 已成为企业 AI 的架构控制点。当加速器容量成为主导约束时,云最令人欣慰的假设(即您可以按需扩展而无需考虑太远)就不再是事实。这种转变产生了直接的运营后果:容量规划又回来了。不是旧的 [...]
How We Bet Against the Bitter Lesson
我一直告诉自己和任何愿意倾听的人,智能体技能指向一种新型的未来人工智能 + 人类知识经济。当然,这不仅仅是技能。还有 Jesse Vincent 的 Superpowers 和 Anthropic 最近推出的 Claude Cowork 插件。如果您还没有遇到过这些,请继续阅读。它应该[...]
Semantic Layers in the Wild: Lessons from Early Adopters
我的第一篇文章阐述了语义层可以为现代企业带来什么:每个需要它的人都可以访问单一事实来源 - Tableau 和 Power BI 中的 BI 团队、热爱 Excel 的分析师、通过 API 进行的应用程序集成,以及现在跨组织激增的 AI 代理 - 所有这些都来自相同的受监管、高性能指标 [...]
Why Multi-Agent Systems Need Memory Engineering
大多数多智能体人工智能系统在悄然失效之前都会付出高昂的代价。对于任何调试过该模式的人来说,这种模式都很熟悉:代理 A 完成一项子任务并继续前进。代理 B 由于无法了解 A 的工作,因此使用略有不同的参数重新执行相同的操作。代理 C 收到双方的不一致结果并协商达成一致。 [...]
Control Planes for Autonomous AI: Why Governance Has to Move Inside the System
在过去十年的大部分时间里,人工智能治理在其本应监管的系统之外舒适地生活着。政策已制定。进行了审查。模型获得批准。审计是在事后进行的。只要人工智能表现得像一种工具——按需生成预测或建议——这种分离就基本上有效。这个假设正在被打破。作为人工智能 [...]
The Hidden Cost of Agentic Failure
Agentic AI 显然已经超越了流行词的地位。麦肯锡 2025 年 11 月的调查显示,62% 的组织已经在试验人工智能代理,表现最好的组织以效率、增长和创新的名义将其推入核心工作流程。然而,这也是事情变得不舒服的地方。该领域的每个人都知道 [...]
Packaging Expertise: How Claude Skills Turn Judgment into Artifacts
想想当您入职新员工时会发生什么。首先,您为他们提供工具。电子邮件访问。松弛。客户关系管理。办公软件。项目管理软件。开发环境。将一个人连接到他们完成工作所需的系统。然而,这是必要的但还不够。没有人会仅仅因为可以登录 Salesforce 就变得高效。 [...]
AI Is Not a Library: Designing for Nondeterministic Dependencies
在软件工程的大部分历史中,我们都是围绕一个简单而令人欣慰的假设构建系统:给定相同的输入,程序将产生相同的输出。当出现问题时,通常是由于错误、配置错误或依赖关系未按照宣传的方式运行。我们的工具、测试策略,甚至 [...]
AI, A2A, and the Governance Gap
在过去的六个月中,我看到企业 AI 团队重复出现同样的模式。 A2A 和 ACP 在架构审查期间点亮了整个房间——协议很优雅,演示令人印象深刻。生产三周后,有人问:“等等,哪个代理商在凌晨 2 点授权供应商支付 50,000 美元?”兴奋转变为担忧。这是 [...]
Conductors to Orchestrators: The Future of Agentic Coding
这篇文章首次出现在 Addy Osmani 的 Elevate Substack 时事通讯上,经作者许可在此重新发布。 AI 编码助手已迅速从新颖性转变为必需品,高达 90% 的软件工程师使用某种 AI 进行编码。但软件开发中正在出现一种新的范式——工程师利用 [...]
AI in China and the United States
几个月前的一次私人晚宴上,黄仁勋显然说出了我一段时间以来的想法。美国在人工智能发展方面明显落后于中国。以下是一些原因。黄首先介绍了中国人工智能开发者(他估计有 100 万)与美国人工智能开发者(2 万)的比例。 [...]
Designing Effective Multi-Agent Architectures
关于代理和多代理系统 (MAS) 的论文从 2024 年的 820 篇猛增到 2025 年的 2,500 多篇。这一激增表明 MAS 现在是世界顶级研究实验室和大学的主要关注点。然而,存在一个脱节:虽然研究正在蓬勃发展,但这些系统在投入生产时仍然经常失败。大多数团队[...]
Reverse Engineering Your Software Architecture with Claude Code to Help Claude Code
这篇文章首次出现在 Nick Tune 的 Medium 页面上,经作者许可在此重新发布。我一直将 Claude Code 用于各种目的,我意识到的一件事是,它对系统功能(域、用例、端到端流程)了解得越多,[...]
The Agentic Commerce Revolution
30 年来,数字商务一直是一个目的地。我们“访问”网站、市场或应用程序。在这个单一的捆绑环境中,我们处理发现、比较和结帐。从产品页面到支付网关的整个网络架构都是建立在这个假设之上的。这个假设现在面临着第一个真正的[...]
关于人工智能扩展的残酷事实是,对于大多数组织来说,这并没有发生。尽管投资数十亿美元,麻省理工学院 NANDA 计划 2025 年的一份报告显示,95% 的企业生成式人工智能试点项目未能带来可衡量的业务影响。这不是一个技术问题;而是一个问题。这是一个组织设计问题。这种系统性的原因 [...]